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摘要 3 

[目的 ] 本 研究 利用 DOTA2 游戏 行为 数据 ， 实 现 对 DOTA2 玩家 黑暗 人 格 三 维度 的 无 侵入 识别 。 
[方法 ] 本 文 利用 Clarity 2 解析 包 对 DOTA2 的 游戏 日 志文 件 进行 解析 ， 提 取 玩 家 的 游戏 行 
为 特征 , 并 利用 黑暗 十 二 条 量 表 对 玩家 的 行为 特征 进行 标注 , 采用 机 器 学 习 的 方法 实现 对 黑 
暗 人 格 三 维度 的 识别 。 

[结果 ] 结 果 发 现 , 在 马 基 雅 维 利 主义 、 自 恋 和 精神 病态 三 维度 上 ,采用 高 斯 过 程 回归 算 法 建 
立 的 模型 在 效 度 和 信和 度 上 表现 最 佳 ， 模 型 预测 值 与 真实 值 之 间 的 相关 系数 在 0. 31-0. 45 之 
间 ， 重 测 信和 度 在 0. 33-0. 53 之 间 。 
[局 限 ] 本 研究 未 将 被 试 的 言语 行为 特征 纳入 到 建 模 过 程 中 ， 使 得 游戏 行为 特征 不 够 全 面 。 
[结论 ] 研 究 结果 发 现 游戏 行 为 数据 能 够 帮助 预测 个 体 的 黑暗 人 格 ， 并 且 通 过 高 斯 过 程 回归 
建立 的 模型 具有 最 高 信 效 度 。 

关键 词 黑暗 人 人格， 游戏 行为 ， 机 器 学 习 ，DOTA2 

分 类 号 : B849 


Dark Personality Prediction from Player in-game Behavior: Machine 


Learning Methods 


LyuSihua” Chen Wenwen Zhang Yichuan Zhu Tingshao™’ 
1 (University of Chinese Academy of Sciences, Beijing 10049) 
2 (Institute of Psychology, Chinese Academy of Sciences Beijing 100101 ) 
3 ( Beijing Normal University Beijing 100875 ) 

Abstract: 
[Objective] By utilizing players”behavioral data in DOTA2, this study proposed a non-intrusive 
method to identify the Dark Personality of game players. 
[Methods] After extracting behavioral features from DOTA2 replay files with the help of the 
parsing tool Clarity 2 package, and obtaining players” dark personality through Dirty Dozen, we 
recruited machine learning methods to predict players’ sub-dimensions of Dark Personality. 
[Results] Results showed that best performance occurred with Gaussian Process Regression on 
Machiavellianism, narcissism and psychopathy. The correlations between predicting values and 
actual values were between 0.31 and 0.45, and the test-retest correlations were between 0.33 and 
0.53. 
[Limitations] This study did not involve players’ verbal behavior in the process of establishing 
models, resulting that the features sets were not comprehensive enough. 
[Conclusions] It suggested that in-game behavior data was able to help predict Dark Personality of 
players, and the models built by Gaussian Process Regression had the best results in terms of validity 
and reliability. 
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1 引言 


黑暗 人 格 作 为 最 具 代 表 性 的 人 格 特质 群 之 一 ，、" ， 通 过 马 基 雅 维 利 主义 、 自 
恋 和 精神 病态 3 个 维度 反映 人 性 的 “阴暗 面 ”“”。 过 往 已 有 研究 表明 个 体 的 黑暗 
人 格 与 其 游戏 策略 和 游戏 类 型 偏好 相关 联 , Malesza” 基 于 因 徒 困境 游戏 研究 , 提 
出 马 基 雅 维 利 主义 水 平 与 精神 病态 水 平 的 高 低 与 游戏 叛变 行为 的 次 数 之 间 存 在 
显著 正 相 关 。Curtis 等 人 ”以 《Flipit》 游 戏 为 研究 工具 ， 发 现 马 基 雅 维 利 主义 
与 玩家 的 战略 取向 有 关 ， 而 精神 病态 与 直接 攻击 行为 有 关 ， 目 恋 与 过 度 自 信 的 行 
为 有 关 。 在 游戏 类 型 偏好 的 研究 上 ，Melzer5 指出 精神 病态 、 马 基 雅 维 利 主义 水 
平 高 的 玩家 更 偏好 暴力 、 反 社会 主题 的 游戏 。 由 此 可 以 看 出 ,个 体 的 黑暗 人 格 能 
够 对 个 体 的 游戏 策略 以 及 游戏 选择 造成 影响 , 假如 能 够 实现 对 个 体 黑暗 人 格 的 预 
测 ， 就 能 进一步 帮助 游戏 公司 优化 游戏 内 部 的 玩家 匹配 算法 与 游戏 推荐 机 制 ， 提 
升 游戏 对 抗体 验 以 及 游戏 推荐 算法 的 精度 。 

目前 得 到 最 广泛 应 用 的 人 格 测量 方法 为 问卷 法 , 因 其 具备 操作 便利 性 与 较 高 
的 信 效 度 "， 但 问卷 法 也 存在 一 些 局 限 性 。 第 一 ， 问 卷 方法 需要 被 试 具备 主动 报 
告 的 意愿 ， 因 此 在 被 试 相 对 不 配合 时 难以 进行 ”; 第 二 ， 问 卷 形式 较为 枯燥 ， 如 
若 题 量 比 较 大 ， 被 试 会 产生 疲倦 感 ， 从 而 导致 不 良 情绪 的 产生 ， 进 一 步 拉 低 填写 
意愿 。 假 如 游戏 运营 商 期 待 大 批量 地 获取 游戏 玩家 的 黑暗 人 格 特征 ,若是 通过 问 
卷 法 实施 采集 , 很 难保 证 用 户 均 有 意愿 配合 问卷 填 答 且 不 会 给 玩家 造成 不 良 的 游 
戏 体验 。 另 一 种 方法 则 是 实现 基于 游戏 的 测评 ， 基 于 游戏 的 测评 是 指 以 游戏 或 者 
游戏 化 的 活动 为 基础 ， 实 现 对 个 体 心理 特征 的 识别 与 量化 ”"。 这 里 的 游戏 所 指向 
的 范围 十 分 广泛 ,涵盖 现实 世界 中 的 麻将 、 棋 牌 等 范 技 场景 ， 同 时 也 指向 虚拟 网 
络 环境 中 的 游戏 ， 例 如 MOBA 类 游戏 。 此 类 测评 具有 以 下 两 个 优势 : 其 一 ， 多 元 
有 趣 的 测验 形式 和 测试 场景 ， 易 提高 受 访 者 的 参与 动机 与 投入 程度 "; 第 二 ， 生 
态 化 、 无 侵扰 , 只 需 通 过 用 户 授 权 后 方 可 使 用 其 数据 ,不 需要 依靠 用 户 自 我 报告 ， 
不 会 给 被 试 带 来 侵扰 ”。 因 此 ， 采 用 基于 游戏 的 测评 能 够 在 一 定 程度 上 克服 问卷 
测量 在 应 用 场景 上 的 局 限 性 。 实 际 上 ， 已 经 有 学 者 在 基于 不 同形 式 的 游戏 ,在 人 
格 测评 领域 进行 了 尝试 "", 从 这 些 研究 都 可 以 看 出 基于 游戏 行为 预测 个 体 的 人 格 
具有 一 定 的 可 行 性 。 

若 要 基于 游戏 行为 实现 对 黑暗 人 格 的 预测 , 那么 选取 何 种 游戏 以 及 能 否 较为 
全 面 地 获取 游戏 行为 就 变 得 尤为 关键 。 而 在 当前 网 络 游 戏 的 所 有 类 别 当 中 , 多 人 
在 线 战 术 竞 技 游 戏 (Multiplayer online battle arena，MOBA) 具备 较 高 的 场 
景 复杂 性 , 通过 对 复杂 对 抗 环境 的 模拟 , 进而 较为 真实 地 还 原 复 杂 对 抗 环境 下 的 
人 类 行为 ， 该 类 游戏 相 比 第 一 人 称 射击 游戏 (First - person shooting game， 
FPS) 以 及 吃 鸡 游戏 〈 一 种 采用 大 逃 杀 模 式 的 第 三 人 称 射击 游戏 ) 更 加 考验 玩家 
的 战略 战术 决策 。 除 此 之 外 ， 虽 然 MOBA 游戏 诞生 较 晚 ， 但 根据 企鹅 智库 ”发 布 
的 《全 球 电 竞 运动 行业 发 展 报告 MOBA 类 游戏 已 经 成 为 最 受 欢迎 的 电子 竞技 类 
型 之 一 ， 其 中 ， 最 受 关注 的 MOBA 游戏 有 《英雄 联盟 》、《D0TA2》 等 。 同 时 ， 随 着 
MOBA 游戏 的 发 展 ， 部 分 MOBA 游戏 ， 比 如 DOTA2， 其 每 一 局 的 游戏 行为 数据 都 能 
够 通过 日 志文 件 的 形式 进行 记录 , 并 衍生 出 了 自己 的 解析 工具 , 可 以 利用 GitHub 
上 的 “Clarity 2” 包 (https://github. com/odota/clarity) 对 游戏 日 志文 件 进 
行 解析 。 此 外 ，DOTA2 还 有 自己 的 数据 开源 平台 
OpenDota (https://www. opendota. com/) ， 在 该 平台 检索 玩家 的 Steam ID 就 能 


够 获得 玩家 的 历史 游戏 数据 。 基 于 此 ， 考 虑 到 DOTA2 游戏 是 一 球 MOBA 游戏 且 自 
带 成 熟 的 解析 工具 和 游戏 数据 平台 , 本 研究 拟 通过 DOTA2 游戏 行为 实现 对 于 玩家 
黑暗 人 格 的 预测 。 可 想 而 知 ， 通 过 解析 工具 获得 的 DOTA2 游戏 行为 纷繁 复杂 ， 但 
随 着 数据 时 代 的 到 来 , 机 器 学 习 已 经 作为 发 掘 数据 规律 的 重要 手段 。 在 实现 对 人 
格 的 预测 上 , 研究 者 已 经 开始 尝试 借助 机 器 学 习 这 一 工具 实现 对 大 五 人 格 的 预测 。 
Yee “采用 多 元 回归 分 析 , 利用 《魔兽 世界 》 中 与 各 维度 具有 较 高 相关 的 行为 特征 ， 
对 大 五 人 格 各 维度 进行 多 元 回归 分 析 , 各 维度 都 能 被 显著 预测 ,预测 值 与 真实 值 
之 间 的 相关 系数 在 0.2 到 0. 3 之 间 。Bunian 等 人 "利用 隐 马 尔 可 夫 模 型 提取 行 
为 序列 特征 ， 通 过 逻辑 斯 带 回归 对 玩家 大 五 人 格 各 维度 上 的 得 分 进行 高 低 分 类 ， 
分 类 精度 在 54% 到 60% 之 间 。 因 此 ， 本 研究 也 将 借助 机 器 学 习 这 一 工具 ， 尝 试 去 
发 现 隐 藏 在 DOTA2 游戏 行为 与 风险 倾向 之 间 的 规律 。 

综 上 , 为 了 弥补 问卷 法 在 黑暗 人 格 测量 应 用 场景 上 的 不 足 ， 本 研究 提出 基于 
DOTA2 游戏 行为 数据 ， 利 用 机 器 学 习 的 方法 实现 对 于 黑暗 人 格 三 维度 的 预测 。 


2 方法 

2.1 被 试 
利用 滚雪球 、 游 戏 网 站 发 帖 等 多 种 方法 ， 招 募 到 296 个 有 效 被 试 。 其 中 286 

名 男性 ， 占 总 体 的 96. 6%， 平均 年 龄 为 22. 97 岁 ， 标 准 差 为 2. 29， 均 为 高 中 学 历 

以 上 。 

有 效 样本 的 筛选 条 件 包含 以 下 三 点 。 

1) 游戏 时 长 大 于 10 小 时 。 为 了 避免 被 试 因为 对 游戏 环境 与 规则 的 不 了 
解 ， 使 得 其 游戏 行为 不 能 有 效 地 反映 其 人 格 特征 的 情况 ， 有 效 样本 的 
筛选 门槛 为 实际 游戏 在 线 进行 时 长 需要 高 于 10 小 时 。 

2) 问卷 填 答 时 长 大 于 300 秒 。 问 卷 填 答 时 长 过 短 ， 该 份 问 卷 结 果 的 效 度 
存疑 ， 因 此 将 会 筛 除 。 

3) 甄别 题 科 选 。 问 卷 中 包含 甄别 题 ， 例 如 “此 题 请 选择 2020”。 若 甄别 题 
答案 错误 表明 被 试 填 答 是 专注 程度 较 低 ， 问 卷 效 度 较 低 ， 将 会 予以 篇 


除 。 
为 了 检验 模型 的 信和 度 ， 在 建立 回归 预测 模型 时 ， 将 其 中 59 位 被 试 的 有 效 样 
本 作为 重 测 被 试 集 。 
2.2 研究 工具 
(1) 问卷 


玩家 基本 信息 问卷 。 该 部 分 问卷 包括 被 试 的 基本 人 口 统计 学 信息 ,包含 性 别 、 
年 龄 、 居 住地 、 婚 姻 状 况 、 学 历 、 月 收入 、Steam ID 等 。 

黑暗 十 二 条 量 表 (Dirty Dozen，DD) , 该 量 表 共 12 个 条 目 ， 分 属 马 基 雅 维 利 
主义 、 自 恋 和 精神 病态 3 个 维度 ”。 量 表 采 用 七 级 评分 ， 计 算 总 分 和 各 因子 分 ， 
高 分 代表 个 体 某 维度 水 平 较 高 。 
(2) DOTA2 

本 研究 采用 的 是 《DOTA2》7. 29 版 , 《DOTA2》 是 一 个 多 人 竞技 游戏 ， 每 一 局 
都 需要 由 两 个 5 人 团队 参与 才能 开启 。 通常 情况 下 , 对 手 和 队友 都 是 通过 系统 匹 
配 或 者 创建 房间 邀请 玩家 两 种 方式 集 齐 的 。 对 手 与 队友 的 实力 会 对 玩家 自身 的 作 
战 策 略 与 游戏 行为 产生 影响 , 例如 过 到 实力 超 强 的 队友 时 ， 本 来 擅长 1 号 位 的 玩 
家 有 可 能 选择 2 号 位 对 其 进行 辅助 。 再 如 遇 到 过 强 的 对 手 时 , 原本 喜欢 使 用 激进 
对 抗 策略 的 玩家 也 有 可 能 转换 为 非 正面 出 击 的 策略 。 因 此 , 为 了 更 大 程度 上 还 原 


玩家 的 心理 特征 ， 本 研究 对 地 图 变量 、 对 手 及 队友 实力 进行 了 控制 ， 即 通过 统一 
游戏 房间 设置 使 得 玩家 的 游戏 地 图 、 对 手 及 队友 实力 保持 一 致 ( 见 图 1) 。 
1) 地 图 变量 。 游 戏 地 图 决定 了 双方 阵营 位 置 以 及 资源 点 的 分 布 。 实 际 游戏 
中 ， 阵 营 的 远近 、 进 攻 推 搭 路 线 、 地 图 资源 点 疏 密 程度 与 安置 位 置 等 都 
会 对 玩家 的 游戏 行为 与 操作 产生 影响 ， 因 此 本 实验 统一 了 地 图 变量 ， 同 
时 将 被 试 固定 在 地 图 左下 方 ， 均 以 此 处 为 原点 进行 游戏 。 
2) 对 手 及 队友 的 实力 。 对 手 与 队友 的 游戏 水 平 会 影响 到 被 试 的 作战 集 略 与 
游戏 行为 ， 因 此 本 实验 将 游戏 难度 与 游戏 模式 进行 了 统一 ， 即 将 游戏 难 
度 设置 为 “困难 ”， 游 戏 模 式 设置 为 “人 机 模式 ”， 即 在 实验 对 战 中 ， 
被 试 的 对 手 及 队友 都 是 作战 水 平 差不多 的 AI, AI 玩家 的 角色 阵容 也 由 系 
统 随 机 匹配 。 


图 1 实验 条 件 下 游戏 房间 设置 截图 


2.3 数据 采集 
数据 采集 分 为 两 个 部 分 , 单 局 游戏 日 志文 件 采集 以 及 历史 游戏 数据 仆 取 , 为 
了 达到 采集 目标 ， 单 局 游戏 日 志文 件 采集 的 实验 流程 如 下 : 
1) 主 试 添 加 被 试 联系 方式 ， 同 时 告知 被 试 实验 目的 并 征求 被 试 的 同意 。 实 
验 开 始 前 ， 主 试 需要 提示 被 试 提 前 完成 《DOTA2》 游 戏 7. 29 版 游戏 的 安 
装 与 被 试 个 人 账号 的 登录 。 
2) 主 试 引导 被 试 在 线 填 写 基 本 人 口 学 问卷 、 黑 暗 人 格 量 表 ， 并 确保 被 试 填 
写 完 毕 并 提交 。 
3) 主 试 通过 屏幕 共享 的 方式 确认 被 试 的 游戏 房间 设置 与 实验 条 件 保 持 一 
致 ， 即 按照 实验 要 求 对 游戏 房间 进行 设置 ， 游 戏 模式 为 “全 英雄 模式 ” 
与 “人 机 模式 ” 游戏 难度 为 “困难 ” 
4) 游戏 结束 后 ， 被 试 在 主 试 的 指导 下 保存 游戏 日 志文 件 并 提交 给 主 试 。 
5) 主 试 再 次 核查 游戏 日 志文 件 与 问卷 数据 采集 无 误 后 ， 发 放 酬谢 金 。 
玩家 历史 游戏 数据 的 疏 取 工作 在 完成 所 有 游戏 日 志文 件 采 集 后 统一 进行 ， 通 
过 编写 Python 扑 虫 ， 利 用 玩家 基本 信息 中 的 Steam ID 扑 取 玩家 的 历史 游戏 数 
据 。 由 于 部 分 玩家 服务 器 响应 失败 ， 共 有 24 位 被 试 的 历史 游戏 数据 爬 取 失 败 ， 
因此 最 后 总 共 获 得 272 位 被 试 的 历史 游戏 数据 。 


为 了 进一步 检验 模型 的 预测 模型 的 重 测 信 度 ， 在 间隔 1 月 后 ， 对 59 名 重 测 
被 试 进 行 重复 数据 采集 ， 即 在 相同 的 实验 条 件 下 再 次 完成 一 局 DOTA2 游戏 ， 获 
得 游戏 日 志文 件 ， 并 再 次 爬 取 他 们 的 历史 游戏 数据 ， 其 中 2 名 玩家 的 历史 游戏 
数据 疏 取 失败 。 

2.4 数据 处 理 
(1) 特征 提取 

本 研究 调用 GitHub 上 提供 的 Clarity2 包 对 游戏 日 志文 件 进行 解析 ， 通 过 
JAVA 程序 将 采集 到 的 玩家 游戏 日 志文 件 解析 为 数据 表格 , 共 解 析出 198 个 字段 。 
筛 除 与 游戏 行为 无 关 数 据 (如 客户 端 存储 路 径 ) 后 ， 实 际 与 游戏 行为 数据 有 关 的 
字段 共 158 个 。 内 容 涵盖 : 

本 局 游戏 的 基本 信息 字段 组 ， 包 含 游戏 模式 、 匹 配 类 型 、 玩 家 数量 、 游 戏 时 
志和 

双方 阵营 信息 字段 组 ， 包含 双方 防御 塔 情 况 、 兵 营 情 况 、 双 方 得 分 、 双 方 总 
金钱 等 ; 

聊天 信息 字段 组 ， 包 括 聊 天 时 间 、 发 言 人 、 聊 天 的 分 词 内 容 及 各 词 频 等 ; 
选 人 信息 字段 组 ， 包 含 禁用 的 英雄 以 及 双方 各 自 挑选 的 英雄 ; 

重大 事件 信息 字段 组 ， 包 含 该 事件 发 生 时 间 、 时 间 类 型 、 事 件 对 象 等 ; 
团 战 信息 字段 组 , 包含 团 战 开始 和 结束 时 间 、 团 战 各 单位 的 技能 及 物品 使 用 


情况 等 ; 
选手 个 人 信息 字段 组 ， 包 仿 个 人 的 各 项 数据 ， 如 人 金钱、 经 验 、 技 能 、 装 备 、 
各 项 击 杀 等 。 


基于 这 些 字段 ， 本 文 设 计 了 比赛 统计 特征 、 玩 家 统计 特征 和 玩家 操作 特征 3 

大 类 特征 ， 并 细 化 为 10 小 类 ， 分别 是 阵营 信息 、 重 大 事件 、 团 战 信息 、 技 能 释 

放 、 战 斗 统 计 、 伤 害 统 计 、 装 备 购买 、 英 雄 选 择 、 侦 查 行为 和 操作 指令 占 比 ， 共 

计 114 个 游戏 行为 特征 。 这 些 特 征 部 分 是 其 他 文献 研究 所 使 用 , 本 文 借鉴 后 提出 ; 

部 分 是 结合 游戏 经 验 以 及 实际 提取 到 的 游戏 行为 数据 ， 采 用 启发 式 的 方式 提出 ， 

并 在 后 续 建 模 中 得 到 验证 。 特 征 提 取 的 步骤 如 下 : 

1) 根据 游戏 日 志文 件 解 析 程 序 ， 可 以 将 文件 解析 为 多 个 数据 表格 存 入 mySQL 数 

据 仓 库 中 ; 

2) 找 出 与 本 实验 所 需 特 征 内 容 相 关 的 数据 表格 , 分 别 是 matches、match_logs、 

player_matches 三 张 表格 , 将 此 三 张 表 格 以 csv 格式 导出 。matches 表 中 存放 了 

团 战 信息 相关 的 比赛 统计 特征 ，match logs 表 中 存放 了 比赛 相关 信息 ， 

player_matches 表 则 存放 了 每 位 玩家 的 所 有 玩家 统计 特征 与 玩家 操作 特征 相关 

的 信息 ; 

3) 通过 Python 程序 将 三 张 表格 中 的 数据 转换 提取 为 特征 设计 中 所 需要 的 数据 。 

根据 表格 中 数据 的 不 同 存储 类 型 ， 需 要 以 不 同 的 方式 对 数据 进行 提取 ; 

。 原 数 据 与 特征 数据 一 一 对 应 的 统计 特征 ， 如 玩家 击 杀 数 ， 直 接 取 原 数据 中 的 
数据 填 入 特征 数据 表 中 即 可 ; 

。 原 数 据 中 以 字典 形式 存放 ， 对 应 特征 数据 中 多 个 特征 的 数据 ， 如 玩家 指令 在 
原 数 据 中 以 字典 方式 存放 ， 关 键 字 为 指令 类 型 ， 值 为 指令 次 数 ， 则 需要 将 字 
典 中 的 每 一 个 关键 字 与 特征 数据 中 的 特征 对 应 并 填 入 相应 的 值 ; 

。 原 数 据 中 以 字典 形式 存放 ， 多 个 关键 字 对 应 特征 数据 中 多 个 特征 的 数据 ， 如 
玩家 对 各 类 型 的 单位 击 杀 数 在 原 数 据 中 以 字典 方式 存放 ， 关 键 字 为 单位 名 ， 
值 为 击 杀 次 数 , 需要 将 类 型 相同 的 单位 值 整合 在 一 起 , 填 入 对 应 特征 数据 中 ; 


。 原 数 据 中 以 列表 形式 存放 ， 每 分 钟 的 累积 数据 ， 如 玩家 金钱 是 一 个 列表 ， 其 
中 元 素 个 数 等 于 游戏 时 长 的 分 钟 数 ， 第 n 个 位 置 的 元 素 的 值 就 是 第 n+1 分 钟 玩 
家 的 金钱 数 总 和 ， 这 类 数据 需 将 列表 中 每 分 钟 累积 的 值 转换 每 分 钟 增加 的 值 ， 
并 将 列表 中 值 以 时 序数 据 处 理 计 算 其 均值 、 标 准 差 以 及 仿 度 和 峰 度 。 

。 原 数 据 中 以 字符 串 形 式 存放 的 信息 ， 需 要 按照 映射 关系 映射 为 分 类 数据 。 

。 原 数据 中 以 列表 形式 存放 , 但 列表 中 又 包含 字典 , 字典 中 又 包含 列表 的 数据 ， 
如 团 战 信息 ， 其 在 原 数据 中 存放 形式 较为 复杂 ， 包含 了 每 一 次 团 战 的 开始 和 
结束 时 间 以 及 每 个 玩家 在 团 长 中 的 技能 释放 、 目 标 选择 、 造 成 伤害 等 等 一 系 
列 信 息 。 特 征 提取 需要 在 其 中 找 出 与 特征 设计 相关 的 数据 信息 并 按 规则 整理 
进入 特征 数据 集中 。 

4) 通过 python 程序 将 每 位 玩家 的 特征 数据 合并 在 一 张 表 格 中 。 整 体 流程 可 参考 


图 2。 
解析 提取 
和 ed] = 


图 2 特征 提取 流程 图 


(2) 数据 转换 

数据 标准 化 。 数 据 标准 化 的 目的 在 于 消除 数量 单位 , 使 数据 保持 在 同一 量 级 
下 ， 减 少 方差 带 来 的 影响 。 具 体操 作为 使 用 SPSS 对 所 有 特征 进行 Z 分 数 转化 为 
标准 化 得 分 。 

虚拟 变量 转化 。 该 目的 是 为 了 使 模型 更 方便 处 理 多 分 类 变量 , 使 模型 结果 具 
备 可 读 性 。 需 要 使 用 虚拟 变量 转化 的 字段 包括 英雄 类 型 字段 、 推 荐 分 类 字段 、 实 
际 分 路 字段 、 最 大 伤害 所 在 时 期 字段 。 
(3) 特征 选择 

基于 规范 化 后 的 原始 可 用 特征 集合 ， 使 用 Wrapper 法 进行 特征 筛选 。 
Wrapper 法 是 指 将 接 下 来 建 模 会 使 用 的 机 器 学 习 算 法 仍 入 到 特征 选择 过 程 中 ， 
通过 测试 特征 子 集 在 建 模 算法 上 的 预测 性 能 来 决定 其 好 坏 ， 此 方法 对 特征 子 集 
中 每 个 特征 的 预测 性 能 并 无 要 求 。 所 以 ， 通 过 该 方法 筛选 出 的 特征 子 集中 的 每 
个 特征 不 定 是 最 优 的 ， 只 确保 筛选 出 的 特征 子 集 是 在 后 续 建 模 算 法 下 最 优 的 
闻 集 ”5 
3 结果 
3.1 人 格 与 行为 相关 分 析 

根据 296 份 有 效 样 本 的 量 表 信 息 , 黑暗 人 格 各 子 维度 的 平均 数 与 标准 差 见 表 
1。 对 296 份 有 效 被 试 人 格 问卷 得 分 及 其 行为 指标 通过 直方 图 、P-P 与 Q-Q 的 图 
形 检验 方法 进行 正 态 检验 。 对 其 中 符合 正 态 分 布 的 变量 进行 皮尔 逊 相关 系数 的 计 
算 , 非 正 态 的 变量 进行 斯 皮尔 曼 相 关 的 计算 。 此 举 的 目的 是 希望 可 以 通过 相关 法 
找到 与 黑暗 人 格 各 子 维度 具有 相关 关系 的 指标 , 为 后 续 的 建 模 打 下 基础 。 相 关 检 
验 结果 见 表 2。 


表 1 黑暗 人 格 各 维度 得 分 4 5SD 


黑暗 人 格 
马 基 雅 维 利 主义 精神 病态 自 恋 
M 12.85 10.52 19.19 
SD 5.36 4.81 4.82 


表 2 黑暗 人 格 量 表 得 分 及 玩家 行为 指标 相关 系数 汇总 表 


黑暗 人 格 
指标 0 
马 基 雅 维 利 主义 精神 病态 自 恋 
指令 3 类 型 占 比 -0.02 -0.03 -0.13” 
指令 8 类 型 占 比 0.14” -0.05 0.08 
指令 21 类 型 占 比 0.14” 0.07 -0.08 
指令 31 类 型 占 比 0.06 -0.14” 0.03 
玩家 死亡 数 0.00 -0.07 0.15” 
玩家 经 验 数 峰 度 0.02 0.06 0.15” 
玩家 经 验 数 偏 度 -0.02 0.02 0.19™* 
玩家 对 防御 塔 承 伤 占 比 0.19™ 0.12 0.03 
消耗 品 购 买 数 量 0.02 -0.13” 0.01 
玩家 插 真 眼 总 数 -0.07 0.01 -0.15* 
玩家 插 真 眼 均值 -0.07 0.01 -0.15” 
玩家 插 真 眼 标准 差 -0.07 0.01 -0.15* 
玩家 插 真 眼 偏 度 -0.07 0.01 -0.15* 


人 六: Xp《0. 05. *%p<0. 01 

从 表 中 可 以 看 出 ， 马 基 雅 维 利 主义 与 玩家 对 防御 塔 承 伤 占 比 (六 = 0.19, p 
《< 0.01) 、 指 令 8 类 型 占 比 (r = 0.14，p《 0.05)、 指 令 21 类 型 占 比 (x = 0. 14， 
PpP《 0.05) 呈现 显著 的 正 相 关 关 系 。 精 神 病 态 与 指令 31 类 型 占 比 (r = -0.14, p 
《0.05) 、 消 耗 品 购买 数量 (x = -0.13，p《 0.05) 呈现 显著 的 负 相 关 关 系 。 自 
恋 与 玩家 经 验 数 往 度 (r = 0.19，p《 0. 01) 、 玩 家 经 验 数 峰 度 (r = 0.15, p< 
0. 05) 呈现 显著 的 正 相 关 关 系 ; 自 恋 与 指令 3 类 型 占 比 (r = -0.13，D《 0.05)、 
玩家 插 真 眼 总 数 (r = -0.15，p《 0.05)、 玩 家 插 真 眼 均值 (r = -0.15, p< 
0. 05) 、 玩 家 插 真 眼 标 准 差 (x = -0.15，p《 0. 05) 、 玩 家 插 真 眼 偏 度 (r = - 
0.15，p《 0.05) 呈现 显著 的 负 相关 关系 。 
3. 2 模型 训练 

本 研究 中 党 试 了 多 种 不 同 的 机 器 学 习 算 法 ， 包 括 高 斯 过 程 回 归 、 基 于 回归 
的 支持 向 量 机 等 ， 舱 入 到 游戏 行为 特征 选择 的 过 程 中 ， 再 利用 对 应 的 机 器 学 习 
方法 对 各 维度 进行 模型 训练 ， 利 用 10 折 交叉 验证 对 模型 进行 评估 ， 以 下 表 3、 表 
4 和 表 5 中 呈现 了 其 中 表现 最 佳 的 四 种 算法 。 从 表 中 可 以 看 出 ， 不 论 是 马 基 雅 维 
利 主义 ， 精 神 病 态 还 是 自 恋 三 个 维度 ， 同 样 都 是 使 用 高 斯 过 程 回归 先入 到 特征 


选择 的 模型 训练 结果 表现 最 佳 。 

针对 马 基 雅 维 利 主义 ， 其 预测 值 与 真实 值 之 间 的 相关 为 0. 31， 均 方 根 对 数 
误差 为 5. 13。 该 模型 保留 了 前 期 团 战 总 次 数 、 指 令 1 类 型 占 比 、 指 令 6 类 型 占 
比 、 指 令 13 类 型 占 比 、 指 令 21 类 型 占 比 、 玩 家 对 防御 塔 承 伤 占 比 、 是 否 是 力量 
英雄 、 主 动 道具 使 用 次 数 、 玩 家 插 真 眼 总 数 、 玩 家 插 真 眼 均值 、 信 使 击 杀 数 、 
击 杀 标准 差 、 最 大 伤害 数值 13 种 特征 。 

针对 精神 病态 维度 ， 其 预测 值 与 真实 值 之 间 的 相关 为 0. 36， 均 方 根 对 数 误 
差 为 4. 49。 保 留 了 中 期 团 战 总 次 数 、 对 友 方 使 用 技能 次 数 占 比 、 指 令 12 类 型 占 
比 、 指 令 27 类 型 占 比 、 指 令 29 类 型 占 比 、 指 令 31 类 型 占 比 、 玩 家 反 补 数 、 总 金 
钱 、 了 眩晕 总 时 长 、 玩 家 反 补 数 均值 、 玩 家 对 防御 塔 承 伤 占 比 、 攻 击 装备 购买 数 
量 、 防 御 装 备 购 买 数 量 、 消 耗 品 购买 数量 、 中 立 生 物 击 杀 数 、 最 大 伤害 数值 16 
种 特征 。 

针对 自 恋 维度 ， 其 预测 值 与 真实 值 之 间 的 相关 为 0. 45， 均 方 根 对 数 误差 为 
4. 52。 保 留 了 团 战 总 次 数 、 对 自己 使 用 技能 次 数 占 比 、 指 令 3 类 型 占 比 、 指 令 9 
类 型 占 比 、 指 令 18 类 型 占 比 、 指 令 19 类 型 占 比 、 指 令 21 类 型 占 比 、 指 令 37 类 型 
占 比 、 玩 家 击 杀 数 、 玩 家 金钱 数 标准 差 、 玩 家 金钱 数 峰 度 、 玩 家 经 验 数 偏 度 、 
买 活 次 数 、 玩 家 伤害 全 队 占 比 、 玩 家 对 英雄 伤害 占 比 、 玩 家 对 中 立 生 物 伤害 占 
比 、 玩 家 对 防御 塔 承 伤 占 比 、 主 动 道具 使 用 次 数 、 消 耗 品 购买 数量 、 玩 家 插 真 
眼 总 数 、 玩 家 插 假 眼 偏 度 、 玩 家 插 真 眼 均 值 22 种 特征 。 

表 3 马 基 雅 维 利 主义 回归 预测 模型 结果 


维度 ”筛选 方法 GP SVR KStar GBRT 
r 0. 31 0. 29 0. 27 0. 19 
马 基 雅 MAE 4. 26 4. 26 4. 24 4. 39 
维 利 主 ”Wrapper RMSE 5. 13 5. 20 5. 22 5. 28 
义 RAE 0. 94 0. 94 0. 93 0. 96 
RRSE 0.95 0. 96 0. 96 0. 97 
表 4 精神 病态 回归 预测 模型 结果 

维度 ”筛选 方法 GP SVR KStar GBRT 
r 0. 36 0. 32 0. 28 0. 29 
MAE 3.65 3. 62 3. 75 3.73 

精神 病 
过 Wrapper RMSE 4. 49 4. 58 4.63 4. 60 
RAE 0. 92 0.91 0. 94 0. 94 
RRSE 0. 93 0. 95 0. 96 0. 95 

表 5 自 恋 回归 预测 模型 结果 

维度 ” 算 选 方法 GP SVR KStar GBRT 
0. 45 0. 36 0. 33 0. 27 
MAE 3. 58 3. 66 3.71 3.87 
自 恋 ” Wrapper ” RMSE 4. 52 4.74 4. 79 4. 98 
RAE 0. 92 0. 94 0. 95 0. 99 


RRSE 0. 94 0. 94 0. 97 0. 95 


3.2 重 测 信 度 

考虑 到 效 度 最 好 的 模型 在 重 测 信 度 上 不 一 定 表现 得 最 好 ， 因 此 本 研究 针对 各 
维度 采用 不 同 算法 建立 的 所 有 预测 模型 都 进行 了 重 测 信 度 检验 , 以 此 选取 在 效 度 
和 信和 度 上 都 较 优 的 模型 。 依 据 重 测 被 试 的 前 后 两 次 游戏 行为 数据 ,分 别 短 选 出 各 
维度 该 模型 进行 预测 时 需要 使 用 的 游戏 行为 特征 ,将 第 一 次 ( 初 测 ) 和 第 二 次 ( 重 
测 ) 的 游戏 行为 特征 分 别 输入 ， 得 到 初 测 和 重 测 的 预测 值 并 计算 两 者 的 皮尔 逊 相 
关系 数 ， 即 为 该 模型 的 重 测 信 度 。 

最 终 黑暗 人 格 三 个 维度 的 预测 分 数 与 真实 分 数 的 相关 如 下 表 6 所 示 。 

表 6 黑暗 人 格 各 维度 重 测 信 和 度 汇总 表 


GP SVR KStar GBRT 
马 基 雅 维 利 主义 0. 53” 0. 39” 0. 29” 0. 37™ 
精神 病态 0. 38” 0. 56” -0. 10 0. 29” 
自 恋 0. 33” 0. 45” -0. 01 0. 38” 


人 六: Xp<0.05, x*¥p<0. 01. 

从 表 中 可 以 看 出 ， 马 基 雅 维 利 主义 、 精 神 病 态 与 自 恋 三 个 维度 中 ， 使 用 高 斯 
过 程 回归 (GPR) 算法 建立 的 模型 同时 具备 最 高 效 度 与 最 良好 的 信和 度 ， 重 测 信 度 系 
数 分 别 为 0.53、0. 38 与 0. 33。 


4 讨论 

本 研究 首先 利用 相关 统计 分 析 的 方法 ， 描 述 DOTA2 游 戏 行为 与 黑暗 人 格 特质 
之 间 的 基础 关联 ， 并 利用 机 器 学 习 的 方法 实现 了 对 于 马 基 雅 维 利 主义 、 精 神 病 
态 和 自 恋 三 个 维度 的 无 侵入 预测 。 

针对 相关 研究 结果 ， 在 马 基 雅 维 利 主义 方面 ， 防 御 塔 承 伤 占 比 与 马 基 雅 维 
利 主义 呈正 相关 。 根 据 秦 峰 和 许 芳 呈 对 于 马 基 雅 维 利 主义 的 描述 ， 该 维度 得 分 
高 的 个 体 更 冷酷 无 情 、 注 重 结果 。 防 御 塔 是 游戏 中 为 了 保护 基地 及 本 阵营 玩家 
的 装置 ， 当 敌人 进入 防御 塔 攻击 范围 内 且 对 本 阵营 玩家 造成 伤害 时 ， 此 装置 便 
会 攻击 敌人 。 防 御 塔 承 伤 占 比 为 整 场 对 局 中 防御 塔 对 某 个 体 造 成 的 伤害 量 占 该 
玩家 所 受伤 害 总 量 的 比例 ， 此 比例 越 高 说 明 该 玩家 在 塔下 攻击 对 手 的 次 数 越 
多 。 为 了 击 杀 对 手 ， 甚 至 自己 被 防御 塔 攻击 也 无 妨 。 因 此 该 比例 可 以 一 定 程度 
反映 出 玩家 的 冷酷 无 情 与 注重 结果 的 特质 。 

在 模型 训练 方面 ， 可 以 发 现 三 个 维度 都 是 在 使 用 高 斯 过 程 回归 时 得 到 了 信 
效 度 最 佳 的 模型 ， 因 此 可 以 看 出 高 斯 过 程 回 归 是 相对 而 言 比较 适用 于 本 研究 游 
戏 行为 数据 的 算法 。 其 各 维度 预测 值 与 真实 值 之 间 的 相关 系数 介 于 0. 31 到 0. 45 
之 间 ， 均 方 根 对 数 误 差 介 于 4. 49 到 5. 13 之 间 ， 重 测 信和 度 介 于 0. 33 到 0. 53 之 间 ， 
所 得 回归 预测 模型 均 具 备 一 定 的 效 度 与 信和 度 ， 具 有 应 用 价值 。 本 研究 也 存在 不 
足 ， 由 于 被 试 在 实验 过 程 中 开启 的 是 人 机 对 抗 模式 ， 即 除了 玩家 之 外 其 余 战斗 
位 置 均 为 机 器 人 ， 因 此 没有 玩家 在 游戏 中 有 语言 行为 ， 这 与 现实 生活 中 是 不 太 
一 致 的 ， 现 实生 活 中 的 被 试 往往 习惯 于 一 边 操作 一 边 与 队友 通过 语言 或 文字 进 
行 交流 ， 对 于 实验 环境 的 控制 在 一 定 程度 上 造成 了 语言 行为 特征 的 缺失 ， 未 来 
研究 可 以 进一步 将 被 试 的 语言 行为 纳入 到 模型 建立 的 过 程 中 来 。 
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